智能论文笔记

Inference-Based Quantum Sensing

C. Huerta Alderete , Max Hunter Gordon , Frederic Sauvage , Akira Sone , Andrew T. Sornborger , Patrick J. Coles , M. Cerezo

分类：机器学习 | (统计)机器学习

2022-06-20

在标准量子传感（QS）任务中，One旨在通过系统测量结果估算未知参数$ \ theta $，该参数$ \ theta $编码为$ n $ qubit的探测态。此任务的成功取决于将参数的变化与系统响应$ \ MATHCAL {r}（\ theta）$（即测量结果的变化）相关联的能力。对于简单的情况，$ \ Mathcal {r}（\ theta）$的形式是已知的，但是对于现实情况而言，不能说相同，因为不存在一般的封闭式表达式。在这项工作中，我们为QS提供了基于推理的方案。我们表明，对于一般的编码统一家庭，$ \ Mathcal {r}（\ theta）$只能通过仅在$ 2N+1 $参数下测量系统响应来充分表征。反过来，这使我们能够在测量响应中推断未知参数的值，并确定感应方案的灵敏度，这表征了其整体性能。我们表明，如果一个人以许多镜头来测量系统响应，则推理错误的可能性很小，但仅缩放为$ \ omega（\ log^3（n）/\ delta^2） $。此外，所提供的框架可以广泛应用，因为它对于任意探针状态和测量方案仍然有效，甚至在存在量子噪声的情况下也保持。我们还讨论了如何将结果扩展到统一家庭之外。最后，为了展示我们的方法，我们在实际量子硬件和数值模拟中实现了它的QS任务。

translated by 谷歌翻译

Noise-Induced Barren Plateaus in Variational Quantum Algorithms

Samson Wang , Enrico Fontana , M. Cerezo , Kunal Sharma , Akira Sone , Lukasz Cincio , Patrick J. Coles

分类：机器学习

2020-07-28

变形量子算法（VQAS）可以是噪声中间级量子（NISQ）计算机上的量子优势的路径。自然问题是NISQ设备的噪声是否对VQA性能的基本限制。我们严格证明对嘈杂的VQAS进行严重限制，因为噪音导致训练景观具有贫瘠高原（即消失梯度）。具体而言，对于考虑的本地Pauli噪声，我们证明梯度在Qubits $ N $的数量中呈指数呈指数增长，如果Ansatz的深度以$ N $线性增长。这些噪声诱导的贫瘠强韧（NIBPS）在概念上不同于无辐射贫瘠强度，其与随机参数初始化相关联。我们的结果是为通用Ansatz制定的，该通用ansatz包括量子交替运算符ANSATZ和酉耦合簇Ansatz等特殊情况。对于前者来说，我们的数值启发式展示了用于现实硬件噪声模型的NIBP现象。

translated by 谷歌翻译

Achieving Transparency in Distributed Machine Learning with Explainable Data Collaboration

Anna Bogdanova , Akira Imakura , Tetsuya Sakurai , Tomoya Fujii , Teppei Sakamoto , Hiroyuki Abe

分类：机器学习 | 人工智能

2022-12-06

Transparency of Machine Learning models used for decision support in various industries becomes essential for ensuring their ethical use. To that end, feature attribution methods such as SHAP (SHapley Additive exPlanations) are widely used to explain the predictions of black-box machine learning models to customers and developers. However, a parallel trend has been to train machine learning models in collaboration with other data holders without accessing their data. Such models, trained over horizontally or vertically partitioned data, present a challenge for explainable AI because the explaining party may have a biased view of background data or a partial view of the feature space. As a result, explanations obtained from different participants of distributed machine learning might not be consistent with one another, undermining trust in the product. This paper presents an Explainable Data Collaboration Framework based on a model-agnostic additive feature attribution algorithm (KernelSHAP) and Data Collaboration method of privacy-preserving distributed machine learning. In particular, we present three algorithms for different scenarios of explainability in Data Collaboration and verify their consistency with experiments on open-access datasets. Our results demonstrated a significant (by at least a factor of 1.75) decrease in feature attribution discrepancies among the users of distributed machine learning.

translated by 谷歌翻译

Non-readily identifiable data collaboration analysis for multiple datasets including personal information

Akira Imakura , Tetsuya Sakurai , Yukihiko Okada , Tomoya Fujii , Teppei Sakamoto , Hiroyuki Abe

分类：机器学习

2022-08-31

多源数据融合，共同分析了多个数据源以获得改进的信息，引起了广泛的研究关注。对于多个医疗机构的数据集，数据机密性和跨机构沟通至关重要。在这种情况下，数据协作（DC）分析通过共享维数减少的中间表示，而无需迭代跨机构通信可能是合适的。在分析包括个人信息在内的数据时，共享数据的可识别性至关重要。在这项研究中，研究了DC分析的可识别性。结果表明，共享的中间表示很容易识别为原始数据以进行监督学习。然后，这项研究提出了一个非可读性可识别的直流分析，仅共享多个医疗数据集（包括个人信息）的非可读数据。所提出的方法基于随机样本排列，可解释的直流分析的概念以及无法重建的功能的使用来解决可识别性问题。在医学数据集的数值实验中，提出的方法表现出非可读性可识别性，同时保持了常规DC分析的高识别性能。对于医院的数据集，提出的方法在仅使用本地数据集的本地分析的识别性能方面表现出了9个百分点的改善。

translated by 谷歌翻译

HTML版本

Another Use of SMOTE for Interpretable Data Collaboration Analysis

Akira Imakura , Masateru Kihira , Yukihiko Okada , Tetsuya Sakurai

分类：机器学习

2022-08-26

最近，已经开发了数据协作（DC）分析，以跨多个机构跨多个机构提供隐私的综合分析。 DC分析集中了单独构建的维度减少中间表示形式，并通过协作表示实现集成分析，而无需共享原始数据。为了构建协作表示形式，每个机构都会生成并共享一个可共享的锚数据集并集中其中间表示。尽管随机锚数据集对DC分析的功能很好，但使用其分布与RAW数据集的分布接近的锚数据集有望改善识别性能，尤其是对于可解释的DC分析。基于合成少数群体过度采样技术（SMOTE）的扩展，本研究提出了一种锚数据构建技术，以提高识别性能，而不会增加数据泄漏的风险。数值结果证明了所提出的基于SMOTE方法的效率比人工和现实世界数据集的现有锚数据构建体的效率。具体而言，所提出的方法在收入数据集的现有方法上分别实现了9个百分点和38个百分点的性能改进。提出的方法提供了SMOTE的另一种用途，而不是用于不平衡的数据分类，而是用于隐私保护集成分析的关键技术。

translated by 谷歌翻译

HTML版本

Collaborative causal inference on distributed data

Yuji Kawamata , Ryoki Motai , Yukihiko Okada , Akira Imakura , Tetsuya Sakurai

分类：机器学习

2022-08-16

近年来，通过分布式数据的隐私保存的因果推断技术的开发引起了人们的关注。为了解决这个问题，我们提出了基于数据协作（DC-QE）的准实验，该实验可以从具有隐私保护的分布式数据中获得因果推断。我们的方法通过仅共享降低维度的中间表示来保留私人数据的隐私，这些中间表示由各方单独构建。此外，我们的方法可以减少随机错误和偏见，而现有方法只能减少治疗效果估计中的随机错误。通过对人工和现实世界数据的数值实验，我们确认我们的方法可以比单个分析得出更好的估计结果。随着我们方法的传播，可以将中间表示形式作为开放数据发布，以帮助研究人员找到因果关系并积累为知识库。

translated by 谷歌翻译

Word Embedding for Social Sciences: An Interdisciplinary Survey

Akira Matsui , Emilio Ferrara

分类：人工智能

2022-07-07

为了从复杂的数据中提取基本信息，计算机科学家一直在开发学习低维表示模式的机器学习模型。从机器学习研究的这种进步来看，不仅计算机科学家，而且社会科学家也从中受益并推进了他们的研究，因为人类的行为或社会现象在于复杂的数据。为了记录这一新兴趋势，我们调查了最近的研究，该研究将单词嵌入技术应用于人类行为挖掘，建立分类法以说明被调查论文中使用的方法和程序，并突出显示最新的新兴趋势，将单词嵌入模型应用于非文本人类人类行为数据。这项调查进行了一个简单的实验，警告文献中使用的共同相似性测量，即使它们在总级别返回一致的结果，也可能产生不同的结果。

translated by 谷歌翻译

Brain-inspired probabilistic generative model for double articulation analysis of spoken language

Akira Taniguchi , Maoko Muro , Hiroshi Yamakawa , Tadahiro Taniguchi

分类：人工智能 | 自然语言处理

2022-07-06

人的大脑在其几种功能中分析了口语中的双重发音结构，即双重关节分析（DAA）。单词连接到形成句子和单词由音素或音节组成的层次结构称为双关节结构。尽管已经获得了一些见解，但尚未建立在人脑中DAA的何处以及如何进行DAA。此外，基于概率生成模型（PGM）的现有计算模型不融合神经科学的发现，并且以前尚未讨论过其与大脑的一致性。这项研究将这些现有的计算模型与神经科学的发现进行了比较，映射和整合，以弥合这一差距，并且发现与未来的应用和进一步的研究有关。这项研究提出了一个DAA假设的PGM，该假设可以根据几种神经科学调查的结果在大脑中实现。该研究涉及（i）研究和组织与口语处理有关的解剖结构，以及（ii）与感兴趣区域的解剖结构和功能相匹配的PGM。因此，这项研究提供了新的见解，这些见解将是基础，以进一步探索大脑中的DAA。

translated by 谷歌翻译

Automated Classification of General Movements in Infants Using a Two-stream Spatiotemporal Fusion Network

Yuki Hashimoto , Akira Furui , Koji Shimatani , Maura Casadio , Paolo Moretti , Pietro Morasso , Toshio Tsuji

分类：计算机视觉

2022-07-04

婴儿对一般运动（GM）的评估是早期诊断神经发育障碍的有用工具。但是，其在临床实践中的评估依赖于专家的视觉检查，并且热切期待自动解决方案。最近，基于视频的GMS分类引起了人们的注意，但是这种方法将受到无关信息的强烈影响，例如视频中的背景混乱。此外，为了可靠性，有必要在GMS期间正确提取婴儿的时空特征。在这项研究中，我们提出了一种自动GMS分类方法，该方法由预处理网络组成，该网络从GMS视频中删除不必要的背景信息并调整婴儿的身体位置以及基于两流结构的后续运动分类网络。提出的方法可以有效地提取GMS分类的基本时空特征，同时防止过度拟合与不同记录环境无关的信息。我们使用从100名婴儿获得的视频验证了提出的方法。实验结果表明，所提出的方法的表现优于几个基线模型和现有方法。

translated by 谷歌翻译

Towards Ground Truth for Single Image Deraining

Yunhao Ba , Howard Zhang , Ethan Yang , Akira Suzuki , Arnold Pfahnl , Chethan Chinder Chandrappa , Celso de Melo , Suya You , Stefano Soatto , Alex Wong

分类：计算机视觉

2022-06-22

我们提出了一个大规模的真实世界和干净的图像对数据集，以及一种从图像中降低降解的方法，从图像中降低了降解。由于没有用于降低的现实世界数据集，因此当前的最新方法依赖于合成数据，因此受SIM2REAL域间隙的限制。此外，由于没有真实的配对数据集，严格的评估仍然是一个挑战。我们通过通过对非鼻子变化的细致控制收集第一个真实的配对数据集来填补这一空白。我们的数据集对各种现实世界的雨水现象（例如雨条和雨水积累）进行了配对的培训和定量评估。为了学习对雨现象不变的代表，我们提出了一个深层神经网络，该网络通过最大程度地减少雨水和干净图像之间的雨水不变损失来重建基础场景。广泛的实验表明，所提出的数据集使现有的DERAINER受益，我们的模型可以在各种条件下对真实雨水图像的最先进方法优于最先进的方法。

translated by 谷歌翻译